小型仿人足球机器人MOS 您所在的位置:网站首页 陈恳 清华大学部长 小型仿人足球机器人MOS

小型仿人足球机器人MOS

2024-06-27 05:22| 来源: 网络整理| 查看: 265

机器人足球旨在提供一个标准问题,通过对其求解从而推进人工智能和机器人技术的进步。 设计并实现能够进行足球比赛的仿人机器人并战胜人类世界杯冠军是RoboCup(Robot World Cup,机器人足球世界杯)等组织的终极目标[1]。 然而,高昂的构建成本使得难以直接在多个类人尺寸的机器人上开展技术研究,而构建小型化平台则提供了一种解决方案。 小型平台的身高远低于成人平均身高,但结构比例与成人相近,其覆盖了机器人足球的核心问题,而构建成本却大幅下降,从而具有快速推进相关技术进步的潜力。 国内外已基于小型仿人平台开展了运动规划、 运动控制、 传感信息处理、 环境建模和智能决策等多项研究[2],RoboCup和国际机器人足球联盟(Federation of International Robot-Soccer Association,FIRA)两大机器人足球赛事中身高小于70 cm的小型仿人机器人组别(即Kid-Size组和标准平台组)占据了约2/3的比例。

小型仿人机器人的设计存在诸多难点,例如机器人关节驱动能力有限,本体空间狭小,在部分薄弱环节易产生较大的机械间隙乃至损坏,难以胜任机器人足球的对抗性环境; 受到负载能力和容纳空间的限制,无法采用高性能的感知与控制平台,从而与机器人足球的复杂行为决策需求存在矛盾。 诸如此类关键问题得不到解决,将严重限制小型仿人平台上所能开展的技术研究的广度,降低小型仿人机器人的存在价值。

国内外已有诸多小型仿人足球机器人平台。 Aldebaran-Robotics公司推出的NAO机器人通过批量生产大幅降低了购置成本[3],并成为RoboCup标准平台。 Robotis公司推出的DARwIN-OP采用了模块化关节驱动器,身高仅为45.5 cm,提供了丰富的感知和高性能计算机系统[4]。 尽管产品化的小型平台具有稳定性高的优势,但在结构、 运动和智能方面的协调改进则较为困难,为此众多研究机构仍持续不断地自主开发小型仿人平台。 Friedmann等[5-6]针对足球赛环境下的健壮性、 灵活性以及响应快速性需求,采用Robotis公司模块化关节驱动器、 掌上电脑、 网络摄像机、 姿态传感器,以较低的硬件成本实现了高性能的仿人机器人平台Bruno,其步行速度超越了四足机器人,并具有一系列高度智能的行为决策能力。 Acosta-Calderon等[7]给出了Robo-Erectus多代小型仿人足球机器人的设计细节。 国内研究机构如浙江大学工业控制国家重点实验室的ZJUDancer系列[8]经历了多轮开发,形成了较为成熟的技术体系和稳定的样机平台。 清华大学机器人实验室的MOS系列小型机器人则先后经历了早期的MOS-I、 MOS-II实验型平台以及MOS-III、 MOS2007、 MOS2008、 MOS-Strong/Lite等研究型平台[9-10]。 除上述报道外,历年来参加RoboCup/Humanoid League的队伍均通过TDP(team description paper,队伍描述简介)形式给出了最新的机械、 电气以及软硬件设计概述[11],但TDP并未给出机器人的设计细节。

针对上述问题,本文总结了MOS-7(如图 1所示)这一MOS系列最新平台的构建结果,着重讨论其局部结构设计、 软硬件与算法的协调和综合,从而实现了机器人的整体性能提升。

图 1 MOS-7小型仿人足球机器人外形 图选项 1 系统概述

图 2所示的是MOS-7足球机器人的硬件体系结构。 MOS-7主体结构由20个Robotis公司的伺服驱动器[4]及相互连接的铝合金结构件组成。 该关节伺服驱动器封装了电机、 减速器、 驱动器、 控制器,从而构成一种外形固定的位置伺服单元。

图 2 MOS-7机器人机械及决策控制系统简图 图选项

MOS-7的主要传感器是安装在头部2自由度云台上的摄像头(WebCam),此外还具备MEMS(micro-electro-mechanical system,微机电系统)的IMU(inertial measurement unit,惯性测量单元)来检测机器人姿态以实现步行稳定补偿或跌倒检测。

MOS-7机器人采用了典型的两层控制决策系统,即图 2所示的决策平台与控制平台。 其中,决策系统以一款面向手机的处理器S5PV210为核心,完成图像采集、 滤波、 建模、 决策、 无线通信等任务。 控制平台则以嵌入式单片机LPC1768为核心,完成驱动器控制和姿态信息处理等任务。 两者之间采用点对点方式通信,实现系统的自主运行。 控制与决策系统连同电源系统等均集中布置在MOS-7的胸腔内部,并由躯干外壳保护。

2 机械结构优化 2.1 腿部自由度的配置

MOS-7腿部采用了典型的6自由度布置,以达到实现足部任意位姿的目标[12],髋部正交配置的3个旋转轴使之具有运动学解析逆解[13],进而简化了关节轨迹的生成。 MOS-7髋部旋转自由度布置特点是自躯干至大腿形成了如图 3b所示的RPY(roll-pitch-yaw,横滚-俯仰-偏航)配置形式,而DARwIn-OP[4]及Bruno[5]等平台则采用图 3a所示的YRP(yaw-roll-pitch,偏航-横滚-俯仰)配置方案。

图 3 DARwIn-OP[4]、 Bruno[5]与MOS-7的髋部关节自由度配置对比示意图 图选项

YRP配置形式要求胸腔内预留旋转驱动器布置空间,在保持机器人总身高和决策控制、 电源系统空间的条件下,不得不压缩机器人腿部空间,这样会造成机器人下肢工作空间不足,从而限制了步行速度提升的潜力。 NAO机器人[3]的特殊45°耦合机构能够缓解这一问题,但采用模块化驱动器难以实现这一特殊机构。 RPY形式则能够避免这一缺陷,同时旋转驱动器的下移使得在机器人总质量不变的条件下,整体质心下移,从而增强了步行运动的稳定裕度。 同时,RPY配置形式并未更改髋关节3个旋转轴轴线相交于一点的特征,因而未改变其逆运动学求解难度。

得益于髋关节的RPY构型,MOS-7机器人的大腿与小腿尺寸均从其前代MOS-Strong/Lite的110 mm增至120 mm,有效延伸了腿部机构的工作空间,为步速的提升提供了更大潜力。

2.2 髋关节易损问题的解决

小型仿人足球机器人工作在对抗冲撞的环境中,易出现结构损伤或机械间隙,因而对其结构可靠性提出了较高的要求。 膝关节是步行期间负荷最大、 易出现损伤的位置,因此众多平台均为膝关节配置了大力矩和高强度的驱动器[5],但MOS系列的早期平台如MOS2007与MOS2008等机器人的复制性生产表明,在球场环境频繁的高强度步行条件下,机器人髋部的竖直旋转轴连接处是另一个易出现结构性损伤和间隙的位置(如图 4所示)。 究其原因是双足步行期间支撑腿、 摆动腿交替变化,使该连接点频繁受到拉压交变力作用,还受到腿摆动期间的动力学作用以及机器人侧移旋转步行期间的侧向力作用。 在标准驱动器外形及输出轴的约束下,这一髋部结构的薄弱位置始终难以得到增强。 为了解决这一难题,部分研究者在髋部结构主动轴处增加了滚针轴承,但该方法仅改善了受压条件下的受力状况; 另一些研究者采用了复杂的轴承结构,以使驱动器主动轴仅传递力矩,但该方案将大幅增加机器人质量并占用过多腿部空间。

图 4 髋部关节易损部位示意图 图选项

事实上,机器人受到复杂交变作用力的位置并不局限于图 4所示的位置,诸如踝关节以及髋关节的前摆和侧摆等位置均存在类似的受力状况,但不同的是这些驱动器局部能够实现主动轴和支撑轴的双端连接,从而能够有效承受来自轴向、 径向和切向的交变作用力。 如果能将类似的结构引入髋部连接处,将能够解决其易损的问题。 图 5所示的是一种特殊的髋部结构设计方案,它将髋部的旋转关节的单一主动轴连接转化为双端连接,并将驱动器主动轴由下置更改为上置。 采用增强结构的髋关节在零件数量和体积增加有限的条件下,可以有效承载来自各方向的交变外力,避免了损伤和间隙问题。

图 5 通过驱动器双端连接实现的髋部关节增强结构示意图 图选项

图 5所示的结构曾用于多达10台的MOS-Strong(MOS-7的前代)机器人。 MOS-7髋部自由度构型由YRP形式转变为RPY,并将图 5所示的双端连接结构用于部旋转关节,从而避免了腿部竖直旋转驱动器处的损伤和间隙风险。

3 决策控制系统优化

MOS-7在典型两层硬件控制系统的基础上,主要从系统逻辑分工以及图像采集效率2个方面实现决策控制性能提升。

3.1 决策控制系统的任务划分

在RoboCup机器人足球赛的总体目标下,MOS-7决策控制系统的核心任务包括双足步行运动、 传感信息提取、 环境建模、 路径规划、 自主巡航以及多机器人协作等。 各模块相互连接并连续运行,如图 6所示。 其中针对各独立算法模块已有大量的研究成果[6, 14],MOS-7则主要依据计算量和实时性需求,对算法模块的部署进行了调整。

图 6 MOS-7针对RoboCup/Humanoid League足球赛的决策控制流程 图选项

依据MOS-7的前代机器人、 DARwIn-OP[4]、 Bruno[5]以及大量RoboCup参赛机器人的TDP[11],图 6所示算法的一般执行频率范围和算法负荷、 实时性需求统计如表 1所示。 与智能决策相关的模块如传感信息(视频图像)的获取、 滤波、 建模和路径规划均是计算密集型模块,对平均处理速率有较高要求,但无严格的实时性要求,机器人不会因处理一张图像不及时而出现故障。 关节控制算法模块则需确保机器人的20余个关节在确定的时刻同时执行新的转角指令,从而实现各关节的统一协调运动,因此该模块对实时性具有严格的要求。

表 1 决策控制关键算法性能需求列表 编号算法 模块执行频率 范围/Hz算法 负荷实时性 1滤波及信息提取5~50高低 2定位及环境建模5~50高低 3行为控制5~50高低 4步态规划50~200高高 5步行稳定控制50~200高高 6关节控制50~200低高 表选项

基于上述分析,图像及智能模块应部署于决策平台,这是由于决策平台本质上是一台完整的机载计算机;而关节指令分派则应部署于控制平台,这是由于决策平台的操作系统难以实现实时控制任务,也难以满足IMU以及输入输出设备的复杂接口需求,而一般采用单片机构成的控制平台能够较好地解决这些难题。

步态规划和在线步行稳定控制模块则较为特殊。 在机器人足球赛环境下,为了满足机器人的步行闭环稳定控制需求,需引入姿态信息并通过一定复杂度的计算重新生成关节轨迹或修正已有轨迹,而双足机器人灵活的运动(例如复杂的全方位步行运动[15])需要持续不断地计算新的运动轨迹,且需在下一个关节控制周期来临之前完成新一帧轨迹的计算,因此这2个模块对计算的快速性和实时性均有较高要求,故存在2种部署可能:

1) 步态规划和在线步行稳定控制与智能决策模块一同归入决策平台,将生成的关节轨迹逐帧发送至控制平台。 此时控制平台只具有网关作用,实现关节数据定时分发和IMU定时采集。 DARwIn-OP[4]等机器人即采用这一策略,其控制平台核心仅为8位单片机ATmega-128。 该策略的优势是借助决策平台丰富的软硬件资源,降低了步态规划和稳定控制的软件实现难度,但对决策-控制平台间的通信速率和可靠性提出了较高要求,一旦控制平台没有及时接到数据帧或者出现短暂通信故障均会导致运动中断。 扩展数据帧存储缓冲区使之能够保存多帧关节数据可以部分规避这一风险,但基于IMU步行稳定算法失去了对已发布帧的修正机会。

2) 将步态规划与步行稳定控制算法连同关节数据分发模块部署在控制平台上。 这种方案降低了决策-控制系统间的通信要求,避免了关节失控的风险,并分担了整体计算量。 MOS-7前代机器人[9-10]均引入了高性能的32位微处理器,同时嵌入了RTOS(realtime operating system,实时操作系统)以充分调度计算资源,兼顾运动指令发布的实时性及利用空闲时间执行计算和通信。 MOS-Strong/Lite实现了在线全方位步行运动规划[15]及在线步行稳定控制,但这种方式的缺陷是在嵌入式单片机系统的底层开发和升级算法难度很大。

为此,MOS-7整合了上述2种方案,其原理如图 7所示。 在运动开发阶段,新的步态规划和在线控制策略首先在决策平台上逐步开发和验证,此时控制平台只具有关节数据分发的功能。 相关算法成熟后借助相同的软件框架翻译成底层控制平台的算法,此时控制平台能够自主生成关节轨迹,从而有效实现了2种部署方案优势的融合。

图 7 MOS-7决策控制平台在开发阶段和应用阶段不同的任务分布示意图 图选项 3.2 图像采集系统的优化

视觉是小型仿人足球机器人获取环境信息的主要方法。 尽管图像处理算法是关键环节并备受关注,但机器人本体的图像获取效率是其基础。 随着摄像机分辨率的成倍提升以及未来双目视觉的引入,高速获取可处理的图像数据流逐渐成为值得关注的问题。

多数机器人使用摄像机标称帧速率(如30帧/s),然而在通信传输速率和图像格式的限制下,能够进入图像处理算法的帧数不一定能达到理想数值。 足球机器人的复杂电磁环境、 头部的频繁活动等易对高速率传输信号造成干扰,进而导致系统失效。 因此,完整的视觉采集系统评估标准应至少包含图像分辨率、 可处理图像帧率、 通信可靠性及系统复杂度4个维度。

表 2对目前已有的部分系统方案进行了总结。 表 2的各方案中,USB接口的WebCam(网络摄像机)最为常用,其质量轻、 体积小,软硬件接口复杂度低,能够输出YUV、 RGB及MPEG格式及多种分辨率的视频流数据。 如表 2所示,MOS-Strong/Lite[10]方案传输可直接处理的YUV格式图像,但受限于总线传输速率,仅能达到10 帧/s左右的帧速率,总线接近满负荷传输,易受到干扰而导致采集失败; 表 2中的 MOS2007[9]方案通过传送MPEG压缩格式数据以大幅降低传输负载,但在MPEG转换为可处理的RGB图像时需经历较高代价的DCT(discrete cosine transform,离散余弦变换),实验表明,MOS2007不能满足30帧/s采集速率的原因是单帧需要60 ms的MPEG解码时间。 表 2所列出的其他方案在提升图像采集和处理效率的同时,增加了系统的复杂度及集成难度,因而均不能达到4个评价维度的最优。

表 2 现有多种图像采集方案综合性能对比 摄像机接口方案分辨率可处理帧速率/ (帧·s-1)传输负载机器人 WebCamUSB1.1传送MPEG及软件解码320×24010150 kB/sMOS2007[9] CCD模拟像机专用AD卡采集后经PC104总线传输720×57626模拟信号MOS2008 CMOS摄像机专用DSP采集处理后传输识别结果320×24030仅识别结果MicroBIRO-II[16] CMOS摄像机专用FPGA采集处理后传输识别结果640×48030仅识别结果Bunny[17] WebCamUSB2.0直接传送YUV422格式图像640×480159.2 MB/sMOS-Strong/Lite[10] WebCamUSB2.0传送MPEG及 CODEC硬件解码1 280×720305.4 MB/sMOS-7 表选项

相比之下,MOS-7选用了S5PV210这一Cortex-A8处理器,除了具有低功耗及高计算能力的优势外,其内部所集成的MPEG图形CODEC(coder and decoder,编解码器)是其最重要的特性,该解压模块能够独立于CPU运行,在10 ms以内完成高达1 600×1 200分辨率MPEG图像的解码,这一关键改进使得在WebCam的低传输负载条件下达到了完整30帧/s采集速率,达到了较高的图像分辨率,实现了图像采集系统4个评估维度的最优。 由于该系统仍保留了一定的传输速率裕量,从而也为未来 引入更高分辨率以及双目系统提供了可能性。

4 从粒子滤波定位到粒子决策

仿人机器人在球场上依据不同的局面和自身角色作出奔跑、 争夺、 踢球、 扑救等行为决策,其前提是具有图 8所示的定位和建模能力。 以图 9为例,当机器人位于A点、 足球位于B点时,需要求解出球场坐标系Oxy下的自身位姿(xr,yr,θr)及机器人坐标系Ax′y′下的球位置(xbr,ybr)。 由于足球机器人的运动及视觉观测具有非线性,因而目前的定位及建模算法大多采用Bayes估计理论为基础的粒子滤波算法实现[14]。 该算法以固定数量的一批采样粒子描述自身位置及球位置的概率分布:

$\begin{align} & {{\left( ~{{x}_{r}},{{y}_{r}},{{\theta }_{r}} \right)}_{k}},\text{ }k=1,\cdots ,\text{ }N; \\ & {{\left( x_{b}^{r},y_{b}^{r} \right)}_{p}},\text{ }p=1,\cdots ,\text{ }M. \\ \end{align}$ (1) 图 8 定位建模后集中决策与粒子决策原理对比 图选项 图 9 机器人调整姿态射门过程示意图 图选项

式中: N和M分别是自定位和球定位粒子滤波器的预设粒子总数。

为了作出唯一的动作决策,通常在获得式(1)的概率分布后,利用k-means算法、 直方图法或核密度估计法[14]提取该概率分布的峰值或均值,从而输出最终估计值($~{{{\tilde{x}}}_{r}},{{{\tilde{y}}}_{r}},{{{\tilde{\theta }}}_{r}}$)和($\tilde{x}_{b}^{r},\tilde{y}_{b}^{r}$)以备后续行为决策算法使用。

MOS-7机器人则未采用单一的($~{{{\tilde{x}}}_{r}},{{{\tilde{y}}}_{r}},{{{\tilde{\theta }}}_{r}}$)和($\tilde{x}_{b}^{r},\tilde{y}_{b}^{r}$)作为定位算法和行为决策的接口,转而直接将式(1)所示的粒子群传递给行为控制模块,由粒子决策后再通过取平均或聚类的方法实现决策结果的综合。 2种方法的原理对比如图 8所示。

本文的粒子决策方法具有以下几项优势:

1) 为机器人动作选择提供了更多的信息。 粒子决策的结果不再是单一的运动指令,而是运动指令的概率分布。 例如图 9中机器人在A点调整射门时所求得的指令概率密度可以表示为图 10中的概率分布1。 虽然其峰值表明机器人实现了球门对正,但“需左转”、 “需右转”以及“已对正”三者的概率相差较小,从而表明有较大的射偏概率,因而这3种运动指令均被拒绝。 机器人转而采取带球推进的动作并最终获得概率分布2,此时射门将大幅度提升其进球的可能性。 而定位后集中决策的策略则无法实现这一决策过程,机器人位姿的概率分布信息已在聚类或加权平均运算中丢失,其最终决策动作具有一定的盲目性和随意性。

图 10 机器人调整对正球门问题中采用粒子决策求解的2种动作概率密度分布示意图 图选项

2) 降低了对位姿估计精度的需求。 例如在图 9的机器人射门问题中,在环境对称或视觉信息有限的条件下,定位算法可能得到类似C、 D、 E的粒子分布,尽管其位姿存在较大差异,但粒子决策表明机器人已满足球门对正的条件,从而使得机器人在不必得知其确切位姿时即可起脚射门。 这将有效避免定位建模算法的过度优化(例如使用主动视觉获取更多的传感信息)而导致机器人的工作效率降低。

尽管粒子决策存在上述直观的优点,但其理论基础及定量分析仍有待于后续进一步研究。

5 结 论

MOS-7是目前MOS系列小型仿人足球机器人中最新一代,在典型的模块化关节驱动器及双层决策控制系统的基础上,从机械、 控制决策和算法等多项细节实现了系统综合优化。 RPY形式的髋关节自由度布局在保持运动学解析逆解的前提下,有效提升了腿部的空间设计合理性; 双端连接的增强结构解决了髋关节易损问题。 决策控制系统依据算法模块的实时性和快速性差异对任务模块进行了合理部署; 引入硬件编解码器实现了图像采集系统在图像分辨率、 可处理帧速率、 可靠性及复杂度这4个维度的优化; 粒子决策算法的引入进一步拓展了MOS-7机器人的决策水平。 MOS-7设计体现出有限资源合理配置、 机电综合优化的小型仿人足球机器人平台设计特点。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有